do eda. ne demek?

EDA (Açıklayıcı Veri Analizi) Hakkında

Açıklayıcı Veri Analizi (EDA), bir veri kümesini özetlemek, görselleştirmek ve veri kümesindeki temel kalıpları, ilişkileri ve anormallikleri keşfetmek için kullanılan bir yaklaşımdır. EDA, veri bilimcilerin ve analistlerin verileri daha iyi anlamalarına, hipotezler oluşturmalarına ve daha sonraki modelleme ve analiz adımları için yönlendirme yapmalarına yardımcı olur.

EDA'nın Temel Amaçları:

  • Veri Yapısını Anlamak: Veri kümesindeki değişkenlerin türlerini (sayısal, kategorik vb.), eksik değerleri ve veri dağılımlarını belirlemek. Veri Tipleri
  • Veri Kalitesini Değerlendirmek: Veri kümesindeki hataları, tutarsızlıkları ve aykırı değerleri tespit etmek. Aykırı Değerler
  • Değişkenler Arasındaki İlişkileri Keşfetmek: Değişkenler arasındaki korelasyonları, bağımlılıkları ve etkileşimleri belirlemek. Korelasyon
  • Hipotezler Oluşturmak: Veri kümesinde görülen kalıplar ve ilişkiler temelinde yeni hipotezler geliştirmek ve test etmek. Hipotez Testi
  • Modelleme için Yönlendirme Sağlamak: Verilerin özelliklerine ve ilişkilerine dayanarak uygun modelleme tekniklerini seçmek ve parametreleri ayarlamak. Veri Modelleme

EDA Teknikleri:

  • Özet İstatistikler: Ortalama, medyan, standart sapma, minimum, maksimum gibi tanımlayıcı istatistikleri hesaplamak. Tanımlayıcı İstatistik
  • Veri Görselleştirme: Histogramlar, kutu grafikleri, saçılım grafikleri ve diğer görselleştirmeler kullanarak verileri görsel olarak keşfetmek. Histogram, Kutu Grafiği, Saçılım Grafiği
  • Eksik Değer Analizi: Eksik değerlerin oranını belirlemek ve eksik değerlerle başa çıkmak için uygun stratejiler geliştirmek. Eksik Veri
  • Aykırı Değer Tespiti: Aykırı değerleri tespit etmek ve bunların veri analizini nasıl etkilediğini değerlendirmek. Aykırı Değerler
  • Veri Dönüşümü: Verileri daha iyi analiz edilebilir hale getirmek için log dönüşümü, normalizasyon gibi dönüşümler uygulamak. Veri Normalleştirme